第四章      

一、选择题

1.下面关于串的的叙述中,哪一个是不正确的?(    )【北方交通大学 2001 一、52分)】

A.串是字符的有限序列          B.空串是由空格构成的串

C.模式匹配是串的一种重要运算  D.串既可以采用顺序存储,也可以采用链式存储

2  若串S1=ABCDEFG, S2=9898 ,S3=###,S4=012345,执行

concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4,index(S2,8),length(S2)))

其结果为(    )【北方交通大学    1999    一、5    25/7分)】

AABC###G0123  BABCD###2345  CABC###G2345  DABC###2345

EABC###G1234  FABCD###1234  GABC###01234

3.设有两个串pq,其中qp的子串,求qp中首次出现的位置的算法称为(   

A.求子串       B.联接       C.匹配         D.求串长

【北京邮电大学 2000 二、420/8分)】【西安电子科技大学 1996 一、1 2分)】

4.已知串S=aaab,Next数组值为(    )。【西安电子科技大学 1996 一、7 2分)】

A0123        B1123         C1231           D1211

5.串 ‘ababaaababaa’ 的next数组为(    )。【中山大学 1999 一、7

A012345678999   B012121111212   C011234223456    D0123012322345

6.字符串‘ababaabab’ 的nextval 为(    

A(0,1,0,1,04,1,0,1)           B(0,1,0,1,0,2,1,0,1)

C(0,1,0,1,0,0,0,1,1)           D(0,1,0,1,0,1,0,1,1 )

【北京邮电大学 1999  一、12分)】

7.模式串t=abcaabbcabcaabdab’,该模式串的next数组的值为(  ),nextval数组的值为  ( )。

A0 1 1 1 2 2 1 1 1 2 3 4 5 6 7 1 2    B0 1 1 1 2 1 2 1 1 2 3 4 5 6 1 1 2

C0 1 1 1 0 0 1 3 1 0 1 1 0 0 7 0 1    D0 1 1 1 2 2 3 1 1 2 3 4 5 6 7 1 2

E0 1 1 0 0 1 1 1 0 1 1 0 0 1 7 0 1    F0 1 1 0 2 1 3 1 0 1 1 0 2 1 7 0 1

【北京邮电大学 1998 二、3 2分)】

8.若S=software,其子串的数目是(    )。【西安电子科技大学 2001应用 一、22分)】

A8      B37          C36          D9

9.设S为一个长度为n的字符串,其中的字符各不相同,则S中的互异的非平凡子串(非空且不同于S本身)的个数为(    )。【中科院计算所 1997

A2n-1    Bn2      C(n2/2)+(n/2)   D(n2/2)+(n/2)-1   E. (n2/2)-(n/2)-1  F.其他情况

10.串的长度是指(    )【北京工商大学 2001  6 3分)】

A.串中所含不同字母的个数      B.串中所含字符的个数

C.串中所含不同字符的个数      D.串中所含非空格字符的个数

 

二、判断题

1KMP算法的特点是在模式匹配时指示主串的指针不会变小。(    )【北京邮电大学 2002 一、4 1分)】

2.设模式串的长度为m,目标串的长度为n,当nm且处理只匹配一次的模式时,朴素的匹配(即子串定位函数)算法所花的时间代价可能会更为节省。(    )【长沙铁道学院 1998 一、1 (1)

3.串是一种数据对象和操作都特殊的线性表。(    )【大连海事大学 2001 1L  (1)

 

二、填空题

1.空格串是指__(1)__,其长度等于___(2)__。 【西安电子科技大学 2001软件 一、42分)】

2.组成串的数据元素只能是________。 【中山大学 1998  5 1分)】

3.一个字符串中________称为该串的子串 。 【华中理工大学 2000 一、31分)】

4INDEX(‘DATASTRUCTURE’, ‘STR’)=________。【福州大学 1998 二、4 (2)

5.设正文串长度为n,模式串长度为m,则串匹配的KMP算法的时间复杂度为________

【重庆大学 2000 4

6.模式串P=abaabcac’的next函数值序列为________。【西安电子科技大学 2001软件 一、62分)】

7.字符串’ababaaab’的nextval函数值为________。 【北京邮电大学 2001 二、4 2分)】

8.设TP是两个给定的串,在T中寻找等于P的子串的过程称为__(1)__,又称P__(2)__

【西安电子科技大学 1998 二、5 16/6分)】

9.串是一种特殊的线性表,其特殊性表现在__(1)__;串的两种最基本的存储方式是__(2)____(3)__;两个串相等的充分必要条件是__(4)__。 【中国矿业大学 2000 一、3 4分)】

10两个字符串相等的充分必要条件是_______【西安电子科技大学 1999软件 一、1 2分)】

11U=xyxyxyxxyxy’;t=xxy’;

ASSIGNSU);

ASSIGNVSUBSTRSINDEXst),LENt+1));

ASSIGNm,‘ww’)

REPLACESVm= ________。 【东北大学 1997 一、1  (5)

12实现字符串拷贝的函数 strcpy为:

 void strcpy(char *s , char *t) /*copy t to s*/

{ while  (________)

}   浙江大学 1999 一、5 (3)

13下列程序判断字符串s 是否对称,对称则返回1,否则返回0;如 f("abba")返回1f("abab")返回0      

 int f((1)________)

     {int   i=0,j=0;

      while (s[j])(2)________;

      for(j--; i<j  && s[i]==s[j]; i++,j--);

       return((3)_______)

     }   浙江大学 1999 一、6 (3)

14.下列算法实现求采用顺序结构存储的串s和串t的一个最长公共子串。

程序(a

PROCEDURE  maxcomstr(VAR s,t : orderstring; VAR index,length : integer);

VAR i,j,k,length1:integer;  con:boolean;

BEGIN

 index :=0; length :=0;  i :=1;

WHILE(i<=s.len) DO

[j:=1;

     WHILE (j<=t.len) DO

[ IF (s[i]=t[j])  THEN

 [ k:=1;  length1:=1;  con:=true;

              WHILE  con  DO

                IF (1)__THEN [length1:=length1+1;k:=k+1;] ELSE(2) _;

              IF (length1>length) THEN [index:=i; length:=length1; ]

              (3)____;

]

           ELSE (4)____;

  ]

(5) ___;

  ]

END;

程序(b)

void  maxcomstr(orderstring *s,*t; int index, length)

{int i,j,k,length1,con;

  index=0;length=0;i=1;

  while (i<=s.len)

 {j=1;

while(j<=t.len)

{ if (s[i]= =t[j])

{ k=1;length1=1;con=1;

          while(con)

             if (1) _ { length1=length1+1;k=k+1; }  else (2) __;

          if (length1>length) { index=i;  length=length1; }

          (3)____; 

  }

       else (4) ___;

      }

     (5) __

}  }  【上海大学 2000 2 10分)】

15.完善算法:求KMP算法中next数组。

PROC get _next(t:string,VAR next:ARRAY[1..t.len] OF integer);

BEGIN

 j:=1; k:=(1)__;  next[1]:=0;

 WHILE j<t.len DO

IF k=0 OR t.ch[j]=t.ch[k] THEN BEGIN j:=j+1; k:=k+1; next[j]:=k;END

ELSE k:=(2)___;

END;

【中山大学 1998 1 4分)】

16.下面函数index用于求t是否为s的子串,若是返回t第一次出现在s中的序号(1开始计),否则返回0

例如:s=abcdefcdek’,t=cde,indse(s,t)=3, index(s,aaa)=0 。已知ts的串长分别是mt,ms 

FUNC index(s,t,ms,mt);

i:=1;j:=1;

WHILE  (i<ms) AND (j<mt) DO

  IF s[i]=t[j] THEN  [ (1)__; (2)__]

               ELSE [ (3)___; (4)_ ]

IF j>mt THEN  return (5)____; ELSE  return (6)__

ENDF;

【南京理工大学 1999 三、2 6分)】

17.阅读下列程序说明和pascal程序,把应填入其中的(  )处的字句写在答题纸上。

程序说明:

本程序用于判别输入的字符串是否为如下形式的字符串:

W&M$ 其中,子字符串M是子字符串W的字符反向排列,在此假定W不含有字符&和字符$,字符&用作WM的分隔符,字符$用作字符串的输入结束符。

例如,对输入字符串ab&ba$11&12$ab&dd$&$,程序将分别输出Ok.(),No.(不是)

程序

PROGRAM  accept(input,output);

CONST  midch=&;   endch=$;

VAR   an:boolean;    ch:char;

PROCEDURE  match(VAR  answer: boolean);

   VAR  ch1,ch2:char;   f:boolean;

BEGIN

  read(ch1);

  IF  ch1<>endch

     THEN IF  (1)__

THEN BEGIN match(f);             

                 IF f THEN BEGIN read(ch2); answer:=(2)_ END ELSE answer:=false

               END

          ELSE (3)___

    ELSE (4)___

END;

BEGIN

       writeln(Enter  String:);

       match(an);

       IF  an  THEN BEGIN

                     (5)__ IF (6)_ THEN  writeln(Ok.) ELSE writeln(No.)

                    END

  ELSE   writeln(No.’)

END. 【上海海运学院 1998 七 (15分)】

18.试利用下列栈和串的基本操作完成下述填空题。

initstack(s)          s为空栈;

push(s,x)             元素x入栈;

pop(s)                出栈操作;

gettop(s)             返回栈顶元素;

sempty(s)             判栈空函数;

setnull(st)           置串st为空串;

length(st)            返回串st的长度;

equal(s1,s2)          判串s1s2是否相等的函数;

concat(s1,s2)         返回联接s1s2之后的串;

sub(s,i,1)            返回s中第i个字符;

empty(st)             判串空函数

FUNC   invert(pre:string; VAR  exp:string):boolean;

{若给定的表达式的前缀式pre正确,本过程求得和它相应的表达式exp并返回“true”,否则exp为空串,并返回“false”。已知原表达式中不包含括弧,opset为运算符的集合。}

VAR  s:stack;   i,n:integer;   succ:boolean;   ch: char;

BEGIN

i:=1;  n:=length(pre);   succ:=true;

(1)__;  (2)__;

WHILE  (i<n)  AND  succ  DO

 BEGIN ch:=subpre,i,l;

IF (3)_ THEN (4)__

ELSE IF (5)__THEN (6)_

ELSE  BEGIN 

exp:=concat((7)___,(8)____);

exp:=concat((9)___,(10)___);

(11)__;

END;

i:=i+1

END;

IF (12)___THEN

  BEGIN exp:=concat(exp,sub(pre,n,1)); invert:=true END

ELSE  BEGIN setnull(exp); invert:=false  END

END;

注意:每个空格只填一个语句。 【清华大学 1996 八】

 

、应用题

1.名词解释:串 【大连海事 1996 一、10  (1) 】【河海大学 1998 53分)】

2.描述以下概念的区别:空格串与空串。【大连海事大学 1996 三、2、(1 (2)

3.两个字符串S1S2的长度分别为mn。求这两个字符串最大共同子串算法的时间复杂度为T(m,n)。估算最优的T(m,n),并简要说明理由。 【北京工业大学 1996 一、5 (6)

4.设主串S=xxyxxxyxxxxyxyx’,模式串T=xxyxy’。请问:如何用最少的比较次数找到TS中出现的位置?相应的比较次数是多少? 【大连海事大学 2001   (8)

5KMP算法(字符串匹配算法)Brute(朴素的字符串匹配)算法有哪些改进?【大连海事大学1996三、1((2)

6.已知模式串t=abcaabbabcab’写出用KMP法求得的每个字符对应的nextnextval函数值。

【北京邮电大学 1997  三 (10分)】

7.给出字符串‘abacabaaad’在KMP算法中的nextnextval数组。【北京邮电大学 2000 三、15分)】

8.令t=abcabaa,求其next 函数值和nextval函数值。 【北方交通大学 1994  一 (6分)】

9.已知字符串‘cddcdececdea’,计算每个字符的nextnextval函数的值。【南京邮电大学 2000 2

10.试利用KMP算法和改进算法分别求p1=abaabaa’和p2=aabbaab’的next函数和nextval函数。                 

【东南大学 1999 一、68分)】

11.已知KMP串匹配算法中子串为babababaa,写出next数组改进后的next数组信息值(要求写出数组下标起点)。【西南交通大学 2000 2

12求模式串T=abcaabbac'  的失败函数Next(j)值。西安交通大学 1996 四、4 (5)

13.字符串的模式匹配KMP算法中,失败函数(NEXT)是如何定义的?计算模式串p=aabaabaaabc’中各字符的失败函数值.【石油大学 1998  一、2 (10)

14.设字符串S=aabaabaabaac'P=aabaac'

1)给出SPnext值和nextval值;

2)若S作主串,P作模式串,试给出利用BF算法和KMP算法的匹配过程。

【北方交通大学1998二(15分)】

15.设目标为t=abcaabbabcabaacbacba,模式为p=abcabaa

1)计算模式pnaxtval函数值;(5分)

2)不写出算法,只画出利用KMP算法进行模式匹配时每一趟的匹配过程。(5分)

【清华大学 1998 八(10分)】

16.模式匹配算法是在主串中快速寻找模式的一种有效的方法,如果设主串的长度为m,模式的长度为n,则在主串中寻找模式的KMP算法的时间复杂性是多少?如果,某一模式 P=abcaacabaca’,请给出它的NEXT函数值及NEXT函数的修正值NEXTVAL之值。【上海交通大学 2000  5分)】

17.设目标为S=abcaabbcaaabababaabca’,模式为P=babab’,

1)手工计算模式Pnextval数组的值;(5)

2)写出利用求得的nextval数组,按KMP算法对目标S进行模式匹配的过程。 (5)

【清华大学 1997 四(10分)】

18.用无回溯的模式匹配法(KMP法)及快速的无回溯的模式匹配法求模式串Tnext[j]值,添入下面表中:   

j

1   2   3   4   5   6   7

t

a   a   b   b   a   a   b

kmp法求得的next[j]

                        

快速无回溯法求得的next[j]

                        

【北京邮电大学 1992  三、125/4分)】

19.在改进了的(无回溯)字符串模式匹配中,要先求next数组的值。下面是求nextval值的算法。

TYPE SAR=ARRAY[1..m] OF INTEGER;

     PTY=ARRAY[1..m] OF CHAR;

PROCEDURE next2(P:PTY;VAR NEXTVAL:SAR);

{在模式P中求nextval数组的值}

1      BEGIN

2      J:=1;NEXTVAL[1]:=0;K:=0

3      REPEAT

4        IF (K=0) OR (P[J]=P[K])

5          THEN [ J:=J+1;K:=K+1;

6                 IF P[J]=P[K]

7                   THEN NEXTVAL[J]:=NEXTVAL[K]

8                   ELSE NEXTVAL[J]:=K ]

9          ELSE K:=NEXTVAL[K]

10     UNTIL J=m

11    END;

算法中第4行有P[J]=P[K],第六行中也有P[J]=P[K]。两处比较语句相同。请分析说明此两处比较语句的含义是什么?分析此算法在最坏情况下的时间复杂度是多少?【北京邮电大学 1993 二、26分)】

20.在字符串模式匹配的KMP算法中,求模式的next数组值的定义如下:

nextj=

请问:

1)当j=1时,为什么要取next[1]=0

2)为什么要取max{K},K最大是多少?

3)其它情况是什么情况,为什么取next[j]=1? 【北京邮电大学 1994  二(8分)】

21.给出KMP算法中失败函数f的定义,并说明利用f进行串模式匹配的规则,该算法的技术特点是什么?

【东南大学 1993 一、3 9分) 1997 一、2 8分) 2001 一、6 6分)】

22. 在模试匹配KMP算法中所用失败函数f的定义中,为何要求p1p2……pf(j)p1p2……pj两头匹配的真子串?且为最大真子串? 【东南大学 1996 一、37分)】

23如果两个串含有相等的字符,能否说它们相等?【西安电子科技大学 2000软件 一、3 5分)】

24.设S1,S2为串,请给出使S1//S2=S2//S1成立的所有可能的条件(//为连接符)。

【长沙铁道学院 1997  三、5 (3)】【国防科技大学  1999

25.已知:s 'xyz)+*'t 'xz)*y'。试利用联结、求子串和置换等基本运算,将 s 转化为 t

【北方交通大学 1996 一、35分)】【山东科技大学 2002 6 5分)】

 

部分、算法设计

1.设st为两个字符串,分别放在两个一维数组中,mn分别为其长度,判断t是否为s的子串。如果是,输出子串所在位置(第一个字符),否则输出0。(注:用程序实现)【南京航空航天大学 1997 (10)

2.输入一个字符串,内有数字和非数字字符,如:ak123x456 17960?302gef4563,将其中连续的数字作为一个整体,依次存到一数组a中,例如123放入a[0],456放入a[1],… … 。编程统计其有多少个整数,并输出这些数。【上海大学 1998 13分)】

3. 以顺序存储结构表示串,设计算法。求串S中出现的第一个最长重复子串及其位置并分析算法的时间复杂度。【东南大学 2000 五 (15分)】

类似本题的另外叙述有:

1)如果字符串的一个子串(其长度大于1)的各个字符均相同,则称之为等值子串。试设计一算法,输入字符串S,以“!”作为结束标志。如果串S中不存在等值子串,则输出信息“无等值子串”,否则求出(输出)一个长度最大的等值子串。

例如:若S=abc123abc123!”,则输出“无等值子串”;若S=abceebccadddddaaadd!”,则输出“ddddd”。

【华中科技大学 2001

4.假设串的存储结构如下所示,编写算法实现串的置换操作。【清华大学 1995 五(15分)】

TYPE strtp =RECORD

ch: ARRAY[1..maxlen]  OF  char;

curlen:0..maxlen

END;

5.函数void insert(char*s,char*t,int pos)将字符串t插入到字符串s中,插入位置为pos。请用c语言实现该函数。假设分配给字符串s的空间足够让字符串t插入。(说明:不得使用任何库函数)

【北京航空航天大学 2001 六 (10分)】

6.设计一个二分检索的算法,在一组字符串中找出给定的字符串,假设所有字符串的长度为4

1)简述算法的主要思想;(3)

2)用PASCAL语言分别对算法中用到的类型和变量作出说明;(3)

3)用类PASCAL语言或自然语言写算法的非递归过程; (8)

4)分析该算法的最大检索长度;(3)

5)必要处加上中文注释。(3)

【山东工业大学 1995 八 (20分)】

7设计PASCAL 或C语言的函数 atoi(x).其中X 为字符串,由0--9个数字符和表示正负数的‘-’组成,返回值为整型数值 。浙江大学 1994   (7分)

8已知字符串S1中存放一段英文写出算法format(s1,s2,s3,n),将其按给定的长度n格式化成两端对齐的字符串S2, 其多余的字符送S3。 【首都经贸大学 1998 三、815分)】

9.串以静态存储结构存储,结构如下所述,试实现串操作equal算法.

CONST  maxlen=串被确认的最大长度

TYPE  strtp=RECORD

ch:ARRAY[1..maxlen] OF char;

curlen:0..maxlen

END;

   (以一维数组存放串值,并设指示器curlen指示当前串长)【北京轻工业大学 1998 12分)】

10编写程序,统计在输入字符串中各个不同字符出现的频度并将结果存入文件(字符串中的合法字符为A-Z26个字母和0-910个数字)。西北大学 2000 (10)

11.写一个递归算法来实现字符串逆序存储,要求不另设串存储空间。 【西南交通大学 2000 2

12.已知三个字符串分别为s=’ababcaabcbcaa’,s=’caab,  s’’=bcb’。利用所学字符串基本运算的函数得到结果串为:s’’’=caabcbcaacaa’,要求写出得到上结果串S’’’所用的函数及执行算法。【东北大学 1998 一、1 (10)

13S=S1S2…Sn”是一个长为N的字符串,存放在一个数组中,程序将S改造之后输出:

1)将S的所有第偶数个字符按照其原来的下标从大到小的次序放在S的后半部分;

2)将S的所有第奇数个字符按照其原来的下标从小到大的次序放在S的前半部分;

例如:

S=ABCDEFGHIJKL

则改造后的S为‘ACEGIKLJHFDB’。【中科院计算所 1995

14编一程序,对输入的一表达式(字符串),输出其TOKEN表示。表达式由变量ABC,常数(数字)01,…,9,运算符+*和括号“(”,“)”组成。首先定义符号的类码:

 

 

 

符号

变量

常量

*

+

类码

0

1

2

3

4

5

其次定义符号的TOKEN表示:

 

 

 

 

 

 

 

 

 

 

其中NAMEL是变量名表(不允许有相同名),CONST是常量表(不允许有相同数)。

 例如,假设有表达式(A+A*2+2*B*3#,则将生成如下TOKENL

 

 

 

 

 

 

 

 

 


【吉林大学 1995   (20)